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Procede de traitement d'une sequence sonore, telle qu 1 un 
morceau musical 

La presente invention concerne le traitement d'une 
5 sequence sonore, telle qu'un . morceau de musique ou, de 
fagon plus generale, une sequence sonore comportant la 
repetition d'une sous-sequence. 

Les distributeurs de productions musicales, par exemple 
10 enregistr<§es sur CD, cassette ou autre support, mettent a 
la disposition des clients potentiels des kiosques ou les* 
clients peuvent ecouter une -musique de leur choix, ou 
encore des musiques promues en raison de leur nouveaute . 
Lorsqu'un client reconnait un couplet ou un refrain du 
15 morceau musical qu'il ecoute, il.peut decider d'acheter la 
production musicale correspondante . 

De fagon plus generale, un auditeur d 1 attention moyenne 
concentre davantage son attention sur un enchainement de 

20 couplet et refrain, que sur 1 1 introduction du morceau, 
notamment . On comprendra ainsi qu'un resume sonore 
comportant au moins un couplet et un refrain suffirait 
pour etre diffuse dans des kiosques du type precite, 
plutot que prevoir la production musicale complete a 

25 dif f user . 

Dans une autre application telle que la transmission de 
donnees sonores par telephonie mobile, on comprendra que 
le telechargement du morceau de musique complet sur un 
30 terminal mobile, a partir d'un serveur distant, est 
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beaucoup plus long et, de la, plus onereux que le 
telechargement d'un resume sonore du type precite. 

De meme, dans un contexte de commerce electronique , ,des 
5 resumes sonores peuvent etre telecharges sur .un poste 
communiquant avec un serveur distant, via un reseau etendu 
du type INTERNET. L 1 utilisateur du poste informatique peut 
ainsi passer commande d'une production musicale dont il 
apprecie le resume sonore. 

10 

Toutefois, detecter a 1' oreille un couplet et un refrain 
et creer ainsi un resume sonore pour toutes les 
productions musicales distributes serait une tache d'une 
lourdeur prohibitive. 

15 

La presente invention vient ameliorer la situation. 

L'un des buts de la presente invention est de proposer une 
detection automatisee d'une sous-sequence repetee dans une 
20 sequence sonore . 

Un autre but de la presente invention est de proposer une 
creation automatisee de resumes sonores du type decrit ci- 
avant . 

25 

A cet effet, la presente invention porte d'abord sur un 
procede de traitement d'une sequence sonore, dans lequel : 
a) on applique une transformee spectrale a ladite sequence 
pour obtenir des coefficients spectraux variant en 
30 fonction du .temps dans ladite sequence. 
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Le procede au sens de 1' invention comporte. en outre les 
etapes suivantes : 

b) on determine, par .analyse statistique desdits 
coefficients spectraux, au moins 1 une sous-sequence repetee 
dans ladite sequence, et 

c) on evalue des instants de debut et de fin de ladite 
sous -sequence dans la sequence sonore . 

Avantageusement, selon une etape supplementaire : 

d) on extfait la sous - sequence precitee pour stocker, dans 
une memoire, des echantillons sonores representant ladite- 
sous - sequence . 

Preferentiellement, 1 ' extraction de 1- etape d) concerne au 
moins une sous -sequence dont la duree est la plus 
importante et/ou une sous-sequence dont la frequence de 
repetition est la plus importante dans ladite sequence. 

La presente invention trouve une application avantageuse 
dans l'aide a la detection de def alliances de machines 
industrielles ou de moteurs, notamment en obtenant des 
sequences d • enregistrement sonore de phases d ' acceleration 
et de deceleration du regime moteur. L • application du 
procede au sens de 1- invention permet d'isoler une sous- 
sequence sonore correspondant par exemple a un plein 
regime ou a une phase d • acceleration, cette sous-sequence 
etant, le cas echeant, comparee a une sous-sequence de 
reference. 

Dans une autre application avantageuse a l'obtention de 
donnees musicales du type decrit ci-avant, la sequence 
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sonore precitee est un morceau de musique comportant une 
succession de sous- sequences parmi au moins une 
introduction, un couplet, un refrain, un pont de 
transition, un theme, un motif, ou un mouvement qui se 
repete dans la sequence. 

A l'etape c) , on determine pref erentiellement au moins les 
instants respect if s de debut et de fin d'une premiere 
sous -sequence et d'une seconde sous - sequence . 



Dans une realisation particulierement avantageuse, a 
l'etape d) , on extrait alors une premiere et une seconde 
sous- sequence pour obtenir, sur un support memoire, un 
resume sonore dudit morceau de musique comportant au moins 
la premiere sous-sequence enchainee avec la seconde sous- 
15 sequence. 

Pref erentiellement, la premiere sous-sequence correspond a 
un couplet et la seconde sous -sequence correspond a un 
refrain . 

Toutefois, il peut advenir que des premiere et seconde 
sous -sequences, extraites d'une sequence sonore, ne soient 
pas contigues dans le temps. 

A cet effet, on prevoit en outre les etapes suivantes : 
dl) detecter au moins une cadence de la premiere sous- 
sequence et/ou de la seconde sous-sequence pour estimer la 
duree moyenne d'une mesure a ladite cadence, ainsi qu • au 
moins un segment de fin de la premiere sous-sequence et au 
moins un segment de debut de la seconde sous- sequence , de 
durees respectives correspondant sensiblement a ladite 
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duree moyenne et isoles dans ■■ la sequence . d'un nombre 
entier de durees moyennes, 

d2) . generer au moins une .mesure de transition de duree 
correspondant a ladite duree 1 ' moyenne et comportant une 
5 addition des echantillons sonbres 'd-'au moins ledit segment 
de fin et d 1 au moins ledit segment de debut, 

d3) et concatener la premiere sous-sequence, la • ou les 
mesures de transition et la seconde sous -sequence pour 
obtenir 1 ' enchainement de la pre'miere et de la seconde 
0 sous - sequence . 

On constatera que la succession des etapes dl) a d3) 
trouve, au-dela de la generation automat ique de resumes 
sonores, une application avantageuse a la creation 

5 musicale assistee par ordinateur. Dans cette application, 
un utilisateur peut creer lui-meme deux sous -sequences 
d'un morceau musical, tandis qu'un logiciel comportant des 
instructions pour derouler les etapes dl) a d3) assure un 
enchainement des deux sous- sequences par concatenation, 

) sans artefact et agreable a l'oreille. 

De fagon plus generale, la presente invention vise aussi 
un produit programme d 1 ordinateur , stocke dans une memoire 
d' ordinateur ou sur un support amovible propre a cooperer 
avec un lecteur homologue d 1 ordinateur , et comportant des 
instructions pour derouler les etapes du procede au sens 
de 1 1 invent ion . 

D'autres caracterist iques et avantages de 1 'invention 
apparaitront a 1 1 examen de la description detaillee ci- 
apres, et des dessins annexes sur lesquels : 
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- la figure la represente un signal audio d'un morceau 
de musique correspondant , dans 1 1 exemple represente, 
a une chanson de variete ; 

- la figure lb represente la variation d'energie 
spectrale en fonction du temps, pour le morceau de 
musique dont le signal audio est] represente sur la 
figure la ; 

- la figure lc illustre les durees occupees par les 
different^ passages du morceau de musique de la 
figure la et qui se repetent dans ce morceau ; 

- la figure 2 represente schematiquement des fenetres 
temporelles selectionnees dans deux parties 
respectives du morceau musical pour preparer la 
concatenation de ces deux parties, selon la 
succession des etapes dl) a d3) ci-avant ; 

- la figure 3a represente schematiquement des segments 
Si(t) et Sj (t) selectionnes dans les parties 
respectives du morceau precitees, pour preparer une 
concatenation des deux parties par super- 
position/addition ; 

- la figure 3b illustre schematiquement par le signe 
" © " la superposition/addition precitee ; 

- la figure 4 illustre une fenetre temporelle pour la 
concatenation .precitee, de forme et de largeur 
pref erees ; et 

- la figure 5 represente un organigramme de traitement 
d'une sequence sonore, dans un mode de realisation 
pref ere de la presente invention. 

Le signal audio de la figure la represente l'intensite 
sonore (en ordonnees) en fonction du temps (en abscisses) 
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d'un morceau musical (ici, le morceau "head over feet"® de 
1' artiste Alanis Morissette) . Pour construire ce signal 
audio, les signaux respect if s des voies droite et gauche 
(en mode stereophonique) ont ete synchronises . et 
5 .additionnes . 

Au signal audio represents sur la figure la, on applique 
une transformee spectrale (par exemple de type transformee 
de Fourier rapide FFT) pour obtenir une variation 
10 temporelle de l'energie spectrale du type represents sur 
la figure lb. 

Dans un mode de realisation, il s'agit d'une pluralite de 
FFT a court terme, successives, dont le resultat . est 
15 applique a un banc de filtres sur plusieurs gammes de 
frequences (pref erentiellement de largeurs de bande 
croissantes comme le logarithmique de la frequence) . Une 
autre transformee de Fourier est ensuite appliquee pour 
obtenir des parametres dynamiques du signal audio 
20 (references. PD sur la figure lb) . En particulier, 
I'echelle en ordonnees de la figure lb indique l 1 amplitude 
des variations des composantes a differentes vitesses dans 
un domaine de frequences donne . Ainsi, 1 1 indice 0 ou 2 de 
l'echelle arbitraire en ordonnees de la figure lb 
25 correspond a une variation lente dans les basses 
frequences, tandis que 1 1 indice 12 de cette meme echelle 
correspond a une variation rapide dans les hautes 
frequences. Ces variations sont exprimees en fonction du 
temps, en abscisses (secondes) . Les intensites associees a 
30 ces parametres dynamiques PD, au cours du temps, sont 
illustrees par differents niveaux de gris dont les valeurs 
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relatives" sont indiquees par la- colonne de reference COL 
(a droite de la figure lb). 

On indique que les parametres. dynamiques du type 
represent! sur la figure lb . permettent d> identifier 
completement un morceau de musique. Dans ce contexte 
d'»e/npreinte» d'un morceau de musique, la demande FR- 
28343 63 de la Demanderesse decrit de facon detaillee ces 
parametres et la maniere de lesobtenir. 

i • 

i 

En variante, les variables deduites du signal audio et • 
permettant de caracteriser le." morceau de musique peuvent 
etre de type different, notamment des coefficients dits 
"Mel Frequency Cepstral Coefficients". Globalement, on 
indique que ces coefficients (connus en soi) sont encore 
obtenus par transformed de Fourier rapide, a court terme . 

La figure lc off re une representation visuelle de 
1 'evolution de l'energie spectrale de la figure lb. Sur la 
figure lc, l'abscisse represente le temps (en secondes) et 
les ordonnees representent les differentes parties du 
morceau, tels que les couplets, les refrains, 
1 'introduction, un theme, ou autres . La repetition au 
cours du temps d ' une partie similaire, tel qu'un couplet 
ou un refrain, est representee par des rectangles grises 
qui apparaissent a differentes abscisses dans le temps (et 
qui peuvent etre de largeurs temporelles differentes) , 
mais de meme ordonnees. Pour passer de la representation 
de la figure lb a la representation de la figure lc, on 
met en reuvre une analyse statistique en utilisant par 
exemple l'algorithme des "K-means", ou encore l'algorith 
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"FUZZY K-means" f ou encore une chaine de Markov cachee, 
avec un apprentissage par 1 ■ algorithme BAUM- WELSH, suivi 
d'une evaluation par 1' algorithme de VITERBI . 

5 Typiquement, la determination du nombre d' etats' (les 
parties du morceau de musique) qui sont necessaires a la 
representation d'un morceau de musique s'effectue de fagon 
automatisee, par comparaison de la similarity des etats 
trouves a chaque iteration des algorithmes precites, et en 
10 eliminant les etats redondants. Cette technique, dite de 
"pruning" permet ainsi d'isoler chaque partie redondante 
du morceau de musique et de determiner ses coordonnees 
temporelles (ses instants de debut et de fin, comme 
indique ci-avant) . 

Ainsi, on etudie les variations, par exemple dans les 
frequences tonales (d'une voix humaine) , de l'energie 
spectrale pour determiner la repetition d'un passage 
musical particulier dans le signal audio. 

Preferentiellement, on cherche a extraire un ou plusieurs 
passages musicaux dont la duree est la plus importante 
dans le morceau de musique et/ou dont la frequence de 
repetition est la plus importante. 

Par exemple, pour la plupart des morceaux de variete, on 
pourra choisir d'isoler les parties de refrain, dont la 
repetition est generalement la plus frequente, puis les 
parties de couplet, dont la repetition est frequente, 
puis, le cas echeant, d'autres parties encore si elles se 
repetent . 
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On indique que d'autres . types de sous -sequences 
representatives du morceau de musique peuvent etre 
extraites,, des lors que ces 1 sous r sequences se repetent 
dans- le morceau de musique. Ear . exemple, on peut choisir 
d'extraire un motif musical-, generalement de plus courte 
duree. qu'un couplet ou un refrain, tel gu'un passage.de 
percussions repete dans le morceau de musique, ou encore 
une phrase* vocale scandee plusieurs fois dans le morceau. 
En outre, un theme peut aussi; etre extrait du morceau de 
musique, par exemple une phrase musicale repetee dans un* 
morceau de jazz ou de musique classique. En musique 
classique, un . passage tel qu'un mouvement peut en outre 
etre extrait. 

Sur le resume visuel represents a titre d» exemple sur la 
figure 1c, les rectangles grises indiquent la presence 
d'une partie du morceau telle que 1 1 introduction 
("intro"), d'un couplet ou d'un refrain dans une fenetre 
temporelle indiquee par l'abscisse temporelle (en 
secondes) . Ainsi, entre 0 et environ 15 secondes, le 
morceau de musique demarre par une introduction (indexee 
par le chiffre 2 sur l'echelle en ordonnees) . 
L 1 introduction est suivie de deux alternances de couplet 
(indexe par le chiffre 3) et de refrain (indexe par le 
chiffre 1) jusqu'a environ 100 secondes. 

On se refere maintenant a la figure 5 pour decrire les 
etapes principales du precede pour obtenir le resume 
sonore precite, selon un mode de realisation prefere. Tout 
d'abord, on obtient les signaux audio sur la voie gauche 
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"audio L" et sur la voie droite "audio R" aux etapes 
respectives 10 et 11, lorsque la sequence sonore initiale 
est representee en mode stereophonique . Les signaux de ces 
deux voies sont additionnes a l'etape 12 pour obtenir. un 
signal audio du type represents sur la figure la. Ce 
signal audio est, le cas echeant, stocke sous forme 
echantillonnee dans une memoire de travail ' avec des 
valeurs d' intensity sonores rangees en fonction de leurs 
coordonnees temporelles associees (etape 14) . a ces 
donnees audio, on applique une transformee spectrale (de 
type FFT dans l'exemple represente), a l'etape 1.6, pour 
obtenir, a l'etape 18, les coefficients spectraux Fi(t) 
et/ou leur variation AFi(t) en fonction du temps. A 
l'etape 20, un module d'analyse statistique opere sur la 
base des coefficients obtenus a l'etape 18 pour isoler des 
instants t 0; t 1( ...,t 7 qui correspondent a des instants de 
debut et de fin des differentes sous -sequences qui se 
repetent dans le signal audio de l'etape 14. 

Dans l'exemple represente, le morceau de musique presente 
une structure (classique en variete) du type comportant : 

- une introduction dans le debut du morceau entre un 
instant t 0 et un instant t lr 

- un couplet entre t x et t 2 , 

- un refrain entre t 2 et t 3 , 

- un second couplet entre t 3 et t 4 , 

- un second refrain entre t 4 et t 5 , 

- une introduction, a nouveau, le cas echeant 
agrementee d'un solo instrumental, entre les instants 
t 5 et t 6 , et 
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- la repetition de deux refrains de fin de morceau 
entre les instants t 6 et t 7 . 

A l'etape 22, les instants t p 'a t, sont repertories et 
indexes en fonction du ' passage musical correspondant 
(introduction, couplet ou refrain) et stockes, le cas 
echeant, dans une memoire de travail. A l'etape 23, on 
peut construire alors un resume visuel de ce morceau de 
musique, tel que represents sur 'la' figure 5. 

i 

Dans l'exemple decrit ci-avant d'un morceau de variete ' 
comportant une structure typique, on construit le resume 
sonore a partir d'un couplet extrait du morceau, suivi 
d'un refrain extrait du morceau. A l'etape 24, on prepare 
une concatenation des echantillons sonores du signal audio 
entre les instants t x et t 2/ d'.une part, et entre les 
instants t 2 et t 3 , d» autre part, dans l'exemple decrit. Le 
cas echeant, le resultat de cette concatenation est 
memorise dans une memoire permanent e MEM pour une 
utilisation ulterieure, a l'etape 26. 

Toutefois, en regie generale, 1 ' instant de fin d'un 
couplet isole et 1 ' instant de debut d'un refrain isole ne 
sont pas forcement identiques, ou encore, on peut choisir 
de construire le resume sonore a partir du premier couplet 
et du second refrain (entre t 4 et t 5 ) ou du refrain de fin 
(entre t 6 et t 7 ) . Ainsi , les deux passages selectionnes 
pour construire le resume sonore ne sont pas forcement 
contigus . 



30 
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Une concatenation aveugle de signaux sonores. correspondent 
a deux parties d'un morceau de. musique donne un ressenti 
desagreable a l'oreille. On.decr.it ci-apres, en reference 
aux figures 2, 3a, 3b et 4, 'la construction, d'un signal 
sonore par concatenation de' deux "parties d'un morceau de 
musique, de maniere a surmonter' ce probleme 

L'un des buts de cette construction par concatenation est 
de preserver localement le tempo du signal sonore. 

i 

Un autre but est d' assurer une distance temporelle entre • 
points de concatenation (ou points d ' " alignement" ) egale a 
un multiple entier de la duree d'une mesure. 

Preferentiellement, cette concatenation s'effectue par 
superposition/addition de segments sonores choisis et 
isoles des deux parties respectives precitees du morceau 
de musique. 

On decrit ci-apres une superposition/addition de tels 
segments sonores, dans un premier temps par 
synchronisation de beat (dite "beat-synchrone") , puis par 
synchronisation de mesure selon une realisation preferee. 

On note ci-apres : 

- bpm, le nombre de beats par minute d'un morceau de 
musique , 

- D, la reference de ce nombre bpm (par exemple dans le 
cas d'un morceau note » 120=noire" , bpm=120 et 
D=noire) , 
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- T, la duree (exprimee en secondes) d'un beat, c'est- 
a-dire de la reference D : dans 1 1 exemple. precedent 
ou D=noire , on a 

r= 60 
bpm 

- N, le numerateur de la metrique du morceau de musique 

(par exemple, dans le cas d'une mesure notee "3/4", 
N=3) , 

M# la duree (exprimee en secondes) d'une mesure, 
donnee par la relation M=N.T (soit M=3*60/120 dans 
1' exemple precedent), 

s(t), le signal audio d'un morceau de musique, 
S(t) , le signal reconstruit par super- 

position/addition, et 

- si(t) et Sj(t), les i dme et j dme segments qui 
comportent des signaux audio respectifs appartenant a 
un premier et a un second passage d'un morceau de 
musique, et qui sont utilises pour la construction de 
5(0 par superposition/addition. 

En principe, les premier et second passages precites ne 
sont pas contigus. S(t) est alors obtenu comme suit. 

En se referant a la figure 2, les segments Si(t) et Sj (t) 
sont d'abord formes par decoupage du signal audio a l'aide 
d'une fenetre temporelle h L (t), de largeur L et definie 
(de valeur non nulle) entre 0 et L. Cette fenetre peut 
etre de type rectangulaire , de type dit 11 de harming", de 
type dit "de harming en palier" , ou autre. En se referant 
a la figure 4, un type prefere de fenetre temporelle est 
obtenu par concatenation d'un flanc montant, d'un pallier 
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et d'un flanc descendant. La largeur temporelle preferee 
de cette fenetre est indiquee ci-a'pres. 

On definit alors le premier segment . Si (t) de sorte que : 
5 s i (t) = s(t-i-m i )ji L (t)- [i] 

* 

ou mi est 1' instant de debut ; du premier segment. 

Comme le montre la figure 3a, on construit Sj(t) 
sensiblement de la meme maniere : 

10 * ^(0=^ + Wy)A(0 [Ibis] 

ou mj est i » instant de debut du second segment . 

Meme si la dufee L de la fenetre temporelle est la meme 
pour les deux segments, on indique toutefois que la forme 
15 de la fenetre peut etre • dif f erente d'un segment si(t) a 
l ! autre s-j (t) , comme le montre d'ailleurs la figure 2. 

Soit bi et bj deux positions respectives a 1 ' interieur des 
premier et second segments, appelees ''positions de 
20 synchronisation", par rapport auxquelles s'effectue la 
superposition/addition, telles que : 

0 < b d < L et 0 < bj < L [2] 

Avantageusement , la distance temporelle entre b A et bj est 
25 choisie egale a un multiple entier de la duree T d 1 un beat 
(bj - bi = kT) . Dans ces conditions, on dit qu'il y a 
reconstruction " Jbea t - syn chron e" si 

5(0 = J] *t ' (' " (' ~ J ) " <*' T) + c) [ 4 ] 

avec s'i(t) = Si (t+bi) [5] 
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et ou k' est le plus grand entier tel que k'T < L- (bi-mi) , 
c est une constante de temps telle que c = Jb 2 -nu.. 
Avantageusement, la distance entre les instants Vet mj 
est choisie egale a un multiple entier de k 'NT, dans 
lequel N designe le numerateur de la metrique. 

Ainsi, le signal reconstruit s'ecrit : 

S(0 = 2 s i ' (' ~ 0* - J ) • (*' NT) + c) 



On obtient alors une superposition/addition synchrone a la 
mesure. La figure 3b illustre cette situation. On remarque 
sur la figure 4 que la largeur L de la fenetre temporelle 
precitee est voisine de k'NT (aux flancs montant et 
descendant pres) . Toutefois, on choisira 

preferentiellement dans ce cas des rampes de flancs telles 
que k'T < L-2 (bi-im).. 

Plus particulierement, on choisit les instants m s et mj de 
sorte qu'ils correspondent a des premiers temps de 
mesures. Dans ces conditions, on obtient avantageusement 
une superposition/ addition beat -synchrone dite "alignee". 

Ainsi, en determinant en outre la metrique du premier 
passage et/ou du second passage, on peut effectuer 
reconstruction beat -synchrone a la mesure. Si, de plus, 
choisit les premier et second segments de sorte qu'ils 
commencent par un premier temps de mesure, cette 
reconstruction beat -synchrone est alignee. 



une 
on 
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On indique qu'une reconstruction du signal s(t) pent etre 
menee sur la base de plus ■ de deux passages musicaux a 
concatener. Pour i passages musicaux (i>2) , l a 
generalisation du precede ci^avant s'exprime par la 
relation : 

Ht>=s^t + c) + s 2 Xt-ki'T+c) + s 3 '(t-k,'T + k 2 'T + c) + ... 
+ Si'0 + T,(-lYk J t T + c) 



Chaque entier kj • est defini c'omme l'entier le plus grand 
tel que kf'T g Lj- (bj-nij) , du Lj _ correspond a la largeur de 
la fenetre du jeme passage musical a concatener. 

On indique que les premiers temps de mesure, ou encore la 
metrique, ou encore le tempo d'un morceau de musique, 
peuvent etre detectes automat iquement , par- exemple en 
utilisant des applications logicielles existantes. Par 
exemple, la norme MPEG- 7 (Audio Version 2) prevoit la 
determination et la description du tempo et de la metrique 
d'un morceau de musique, en utilisant de telles 
applications logicielles. 

Bien entendu, la presente invention ne se limite pas a la 
forme de realisation decrite ci-avant a titre d- exemple ; 
elle s'etend a d'autres variantes. 

Ainsi, on comprendra que le resume sonore peut comporter 
plus de deux passages musicaux, par exemple une 
introduction, un couplet et un refrain, ou encore deux 
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passages differents d'un couplet et d'un refrain, tels que 
1 1 introduction et un refrain, par .exemple. 

On remarquera aussi que les etapes representees sous forme 
d'organigramme sur la figure 5 peuvent etre implementees 
par un logiciel inf ormatique dont 1 1 algorithme. reprend 
globalement la structure de 1 ■ organigramme , A ce' titre, la 
presente invention vise aussi un tel programme 
inf ormatique . 
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Revendications 

1. Procede de traitement d'une .sequence sonore/ dans 
lequel : 

5 a) on applique une transformee spectrale a ladite sequence 
pour obtenir des coefficients spectraux variant en 
fonction du temps dans ladite sequence, 

caracterise en ce qu'il. comporte en outre les 
etapes suivantes : 

10 b) on determine, par analyse statistique desdits 
coefficients spectraux, au moins une sous - sequence. repetee 
dans ladite sequence , et 

c) on evalue des instants de debut et de fin de ladite 
sous -sequence dans la sequence sonore. 

15 

2. Procede selon la revendication 1, caracterise en ce 
qu'il comporte en outre une etape : 

d) d' extraction de la sous -sequence pour stocker, dans une 
memoire, des echantillons sonores representant ladite 

20 sous -sequence . 

3. Procede selon la revendication 2, caracterise en ce que 
1' extraction de 1" etape d) concerne au moins une sous- 
sequence dont la duree est la plus importante et/ou une 

25 sous-sequence dont la frequence de repetition est la plus 
importante dans ladite sequence. 

4. Procede selon 1 1 une des revendications 1 a 3, dans 
lequel la sequence sonore est un morceau de musique 
0 comport ant une succession de sous -sequences parmi au moins 
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une introduction, un couplet, •• un refrain, un pont de 
transition, un theme, un motif., uri mouvement, 

caracterise en ce que, a. l'etape c) , on determine 
au moins les instants respect! fS de debut et de fin d'une 
5 premiere sous-sequence et d'une seconde sous - sequence . 

5. Procede selon la revendication ■ 4 , prise en cOmbinaison 
avec la revendication 3, caracterise en ce que la premiere 
sous-sequence correspond a un couplet et la seconde sous- 

10 sequence correspond a un refrain. 

6. Procede selon l'une des revendications 4 et 5, prises 
en combinaison avec la revendication 2, caracterise en ce 
que, a l'etape d) , on extrait une premiere et une seconde 
sous-sequence pour obtenir, sur un support memoi re, un 
resume sonore dudit morceau de musique comportant au moins 
la premiere sous-sequence enchainee avec la seconde sous- 
sequence . 

7. Procede selon la revendication 6, dans lequel les 
extraits des sous -sequences sont non contigus dans le 
temps, caracterise en ce qu'il comporte en outre les 
etapes suivantes : 

dl) d<§tecter au moins une cadence de la premiere sous- 
sequence et/ou de la seconde sous-sequence pour estimer la 
duree moyenne d'une mesure a ladite cadence, ainsi qu'au 
moins un segment de fin de la premiere sous-sequence et au 
moins un segment de debut de la seconde sous - sequence , de 
durees respectives correspondent sensiblement a ladite 
duree moyenne et isoles dans la sequence d'un nombre 
entier de durees moyennes, 
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d2) generer au moins une mesure de transition de duree 
correspondant a ladite duree moyenne et compqrtant une 
addition des echantillons sonores d.'au moins ledit segment 
de fin et d'au moins ledit segment de debut, 
d3) et concatener la premiere sous -sequence, la ou les 
mesures de transition et la seconde sous -sequence pour 
obtenir un enchainement de la premiere et de la seconde 
sous- sequence . 

8. Procede selon la revendication 7, caracterise en ce que 
l'etape dl) comporte un decoupage en au moins deux 
fenetres, de type rectangulaire, de type de Hanning, de 
type de Hanning en palier, ou pref erentiellement de type 
comportant un flanc montant, un pallier et un flanc 
descendant dans le temps . 

9. Procede selon I'une des revendications 7 et 8, 
caracterise en ce que l'etape d2) comporte une 
reconstruction beat-synchrone . 

10. Procede selon la revendication 9, caracterise en ce 
que, a l ! etape dl) , on determine en outre la metrigue de 
la premiere sous-sequence et/ou de la seconde sous- 
sequence, et en ce que l ! etape d2) comporte une 
reconstruction beat-synchrone a la mesure. 

11. Procede selon 1 'une des revendications 9 et 10, 
caracterise en ce que, a l'etape dl) , on determine lesdits 
segments de fin et de debut de sorte qu f ils commencent par 
un premier temps de mesure, et en ce que l f etape d2) 
comporte une reconstruction beat-synchrone alignee. 
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12. Produit programme d • ordinateur , stocke dans une 
memoire d • ordinateur. ou sur. un 'support amovible propre a 
cooperer avec un lecteur d' ordinateur, caracterise en ce 
gu'il comporte des instructions pour derouler les etapes 
du precede selon 1 • une des revindications prececlentes . 
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